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Использование нейронной карты 
для планирования траектории 
мобильного робота 


В статье рассматриваются вопросы построения интеллектуальной системы планирования траектории 
движения мобильного робота. Предлагаемая система планирования основана на одновременной 
работе трех подсистем: нейронной сети, генератора траектории и регулятора скорости. Основная идея 
предлагаемого подхода состоит в использовании нейронной карты как динамического представления 
заданного пространства, информация о которой поступает с внешних источников. 


Введение 


В настоящее время широкое распространение получают автономные подвижные 
системы самых различных классов и функциональных назначений. К ним относятся 
всевозможные транспортные средства (наземные, воздушные, надводные), включая 
мобильных роботов промышленного назначения, предназначенных для выполнения 
разнообразных функций в автономном режиме без участия человека. Задачи точного 
позиционирования мобильных роботов и планирования оптимальных маршрутов их 
перемещения в рабочей области являются одними из фундаментальных проблем 
робототехники. В последние годы все большее распространение получают методы 
решения этих задач на основе интеллектуальных алгоритмов: нейронных сетей, 
генетических алгоритмов и нечеткой логики [1], [2]. 

Впервые использовать нейронные сети в задаче планирования оптимальных 
маршрутов было предложено в 90-х годах прошлого века [3], [4]. Анализ этой и других 
работ в этой области показал, что существует ряд нерешенных проблем, относящихся к 
планированию оптимальных маршрутов для мобильных роботов, осуществляющих одно- 
временное движение в пределах одного рабочего пространства. Общей чертой известных 
методов планирования является то, что выходное решение находится в виде последова- 
тельности точек маршрута траектории, что позволяет обеспечить бесконфликтное движе- 
ние мобильного робота в стационарном рабочем пространстве. Вместе с тем в условиях 
динамического изменения рабочего пространства оптимальное решение должно обеспе- 
чивать бесконфликтное движение не только модификацией маршрута движения, но и 
регулированием скорости движения на определенном участке маршрута. 


Структура системы планирования 


Предлагаемая система позиционирования мобильного робота основана на 
одновременной работе трех подсистем: нейронной сети, генератора траектории и 
регулятора скорости. Разработанная архитектура системы показана на рис. 1. 
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Рассмотрим простейший случай, когда планирование траектории проводится 
для одного мобильного робота в стационарном рабочем пространстве. Отсутствие 
динамических препятствий снимает необходимость планирования с учетом скорости 
перемещения, поэтому архитектура системы может быть упрощена: работают только 
нейронная карта и генератор траектории. 

Введем следующие обозначения: А — мобильный робот, С — заданное рабочее 
пространство. Некоторый внешний источник (сенсорная система) непрерывно обеспе- 
чивает информацией Х об окружающей среде. По получаемой информации опреде- 
ляется конфигурация заданного пространства С и расположение препятствий. Следует 
отметить, что определение точной конфигурации рабочего пространства во многом 
зависит от технических возможностей внешнего источника (сенсорной системы). 
Сенсорная информация Хс помощью энергетических взаимодействий нейронов в сети 
отображается в виде нейронной карты У на нейронной области 2. 


Положение Текущее 


Текущий 
цели положение агента момент времени 


Нейронная сеть Генератор Регулятор 
траектории скорости 


Сенсорная 


информация Траектория 


Рисунок 1 — Архитектура системы планирования 


Основная идея предлагаемого подхода состоит в том, чтобы использовать ней- 
ронную карту как динамическое представление заданного пространства, информация о 
которой поступает с внешних источников. Энергетические взаимодействия нейронов в 
сети подобно распространению волны возмущений приводят к возникновению так назы- 
ваемого ландшафта активации, который используется в дальнейшем как навигационная 
карта для планирования траектории. 

Система работает следующим образом: координаты цели, а также информация об 
окружающей среде поступают на вход аналоговой нейронной сети Хопфилда. Нейроны 
сети входят в состояние равновесия и принимают собственные значения энергии (в 
зависимости от функции активации). Взаимодействия нейронов построенной сети 
обусловлены динамикой и архитектурой самой сети, а также конфигурацией окружаю- 
щего пространства и координатами цели, которая является точкой активации. Значения 
энергии нейронов на данной нейронной области (ландшафт активации) поступают на 
вход блока генератора траектории, который в свою очередь выполняет расчет траектории 
по данным значениям. 


Топология сети 


Для нейронной сети Хопфилда нейрон 1 характеризуется: входным вектором У, 
вектором весовых коэффициентов И’, входным вектором смещения 0., суммарным 


(сетевым) сигналом и, ‚ функцией активации Ф ‚ сигналами: начального состояния и, ; 
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собственной обратной связи о, ; выходными сигналами соседних нейронов о, ; собст- 


й> т? 


венным выходным сигналом состояния и, ; п размерность сети (рис. 2): 


ош > 


АГ 


7 
ФФ] “+ 
И; КОЕК 


ео м 
аи 


0. 


‚ПИ 


Рисунок 2 — Архитектура элементарного нейрона сети Хопфилда 


Сигнал начального состояния 0, суммируется с сигналом собственной обрат- 


ной связи нейрона и, 


й? 


выходными сигналами соседних нейронов о„„, образуя вход- 
ной вектор У, который взвешивается вектором весовых коэффициентов И’, склады- 


вается с вектором смещения 0 и формирует скаляр и‚, который проходит через 
нелинейную функцию активации Ф: 


и = х (+00. 


а) 6) 


Рисунок 3 — Различные топологии сети для 2-мерного пространства: 
а) гексагональная; 6) ортогональная 


Пусть имеется нейронная сеть Хопфилда с и аналоговыми модулями. Все ней- 
роны сети находятся в нулевом состоянии и внешний источник (сенсорная система) 
отключен от входов сети. Тогда нейроны будут размещены в 4-размерной решетке, 
равномерно распределенной по заданному пространству С (где 4 — измерение С). 
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Таким образом, нейронная сеть и созданная нейронная карта служат дискретным 
топологическим упорядоченным представлением С. Топология распределения и под- 
ключения нейронов в сети может меняться. На рис. 3 показаны различные топологии 
сети для 2-мерного пространства. 

Каждый элемент 7 соответствует подмножеству С, заданного пространства С, 


объединение всех С, создают поверхность С. Все конфигурации в пределах С, 


соответствуют модулю Г. Далее мы будем рассматривать только эти отдельные части 
решетки и называть их нейронной областью Е [4]. 

Для создания нейронной карты необходимо, чтобы распространение энергии в 
сети было подобно эффекту распространения волны, поэтому каждый нейрон 1 вза- 
имодействует только с соседними в пределах своего подмножества соседей С,. Тогда 


каждый нейрон в сети имеет лишь связи с коротким диапазоном (прямые или диаго- 
нальные) с симметричным распространением. Все соединения дальнего действия уста- 
новлены в 0. Таким образом, каждый нейрон 1 соединен только с подмножеством 
соседних нейронов, а каждая нейронная область Ё`только с подмножеством соседних 
нейронных областей. 

Топология самоорганизующихся и вероятностных сетей также характеризуется 
расстоянием между нейронами в слое. Для его вычисления используются функции 
расстояния [5]. Функция расстояния между нейронами Ги/ в описываемой сети есть 
функция евклидового расстояния р(&, /): 


р) =УЧЯ-[ЛУ, 


где [Пи [/| - векторы состояний 1-го и /-го нейронов соответственно. 
Для исследуемой сети примем ортогональную топологию с девятью нейронами 
в нейронной области, то есть 8 возможных соседей для каждого нейрона (рис. За)). 
Синаптическая функция выполняет взвешивание входного вектора нейронной 
сети. Для выполнения этой операции используется функция нормированного скалярного 
произведения. Данная функция выполняет скалярное произведение весовой матрицы 
на каждый вектор входа, деленное на сумму элементов каждого вектора [5]: 


где И’ - матрица весов, Р — вектор входа, р — элемент входного вектора. 
Непосредственно значения весов и «соседство» для каждого нейрона опреде- 
ляет функция /. Это, обычно, убывающая функция: 


если О<х<г 


1 
Ло) =4х ; 


0 если х=0 или х>г 


где и = 1,5 — радиус нейронной области А, х - вес связи. 
Исходя из выбранной топологии, примем 7 = 1,5, тогда веса для связей прямого 
действия в пределах нейронной области К, а также веса собственных обратных свя- 


—1 
зей нейронов будут установлены в 1, для диагональных \2 = 0,7071. Получившиеся 
веса симметричны для всех {и ] в пределах подмножества Сь, то есть х(р, 7) =х(1,1). 
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Пусть текущее расположение агента, цели и расположение препятствий опре- 
делены на непрерывном заданном пространстве С и нейроны сети равномерно 
распределены по заданному пространству. Тогда, исходя из описанной выше дискре- 
тизации топологии нейронной сети и условия непересечения областей К, нейрон или 
группа нейронов (в зависимости от разрешения сети) будут находиться на месте 
текущей конфигурации агента — нейрон-агент. Также будут определены нейроны, 
находящиеся на месте цели и препятствий, — нейрон-цель и нейроны-препятствия 
соответственно. Очевидно, что при создании нейронной карты значение одного ней- 
рона не должно соответствовать в одно и то же время агенту и цели или цели и 
препятствию. Идентификация нейронов по их «назначению» осуществляется с по- 
мощью входного вектора начального состояния сети Г. Каждый элемент входного 
вектора и, равен начальному состоянию соответствующего нейрона, его значения 
меняются в диапазоне реальных чисел [0, 1], причем состояние нейрона-цели всегда 
будет установлено в 1, а состояние нейронов-препятствий всегда 0. Начальное 
состояние остальных нейронов также будет равно 0, но их значение будет меняться в 
процессе входа сети в состояние равновесия и определяться заданным вектором 
смещения 0(1) , а также функцией активации Ф. 

После ввода вектора начального состояния в сети необходимо определить 
вектор смещения сети 0(!). Каждый элемент вектора 0 (1) для каждого нейрона 1 


определяет значение смещения следующим образом: 
+ с0 1— цель; 


90 = 


0 :— иначе; 


где бесконечность — очень большое значение. Для исследуемой сети достаточным 
значением смещения для нейрона-цели является 10 (0(1) =10). Так как суммарный 


входной сигнал И. для 1-го нейрона определяется по формуле: 
и, = х (1 +0(1), 


то нейрон цели будет максимально активизирован с самого начала работы сети, он 
активизируется независимо от других нейронов. Точно также состояние всех нейро- 
нов-препятствий будет установлено в 0. Суммарный входной сигнал для всех 
остальных нейронов (включая нейрон-агента) будет определяться лишь значениями 
весов связей в пределах своего подмножества С; и вектором состояния \({), значения ко- 


торого будут меняться в процессе динамических взаимодействий нейронов в сети: 
и = х(Ю. 


Начальный суммарный входной сигнал так же, как и для нейронов препятствий, 
будет равен 0. 
Функция активации, или передаточная функция нейрона, преобразует каждый 


элемент и, входного вектора в элемент о „ вектора выхода [5]: 


о =Ф(и,). 
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Как уже говорилось выше, состояние и, нейрона 1 принимает значение в диа- 
пазоне реальных чисел [0, 1]. 1 — означает, что нейрон максимально активизиро- 
ван, 0 — неактивизированный нейрон. Следовательно, функция активации Ф(х) должна 
быть равна 0 для нулевого сигнала и монотонно возрастать при положительном вход- 
ном сигнале, насыщаясь к 0 и 1 соответственно до +® и —®. Примером такой 
функции является гиперболическая тангенциальная функция. 

Общее состояние сети будет описываться вектором состояний (1) = (6 (1), 
0, (1),....0,(1)) и все его возможные значения определяют фазовое пространство 5 


системы. 


Результаты моделирования 


В качестве примера построим математическую модель предлагаемой сети из 
100 нейронов в пакете моделирования Ма аЪ. Исходя из заданной топологии и зна- 
чений весов связей нейронов, сеть можно представить в виде нейронной сетки раз- 
мерностью 10 х 10, где каждый нейрон расположен в центре ячейки и связан лишь с 
подмножеством нейронов, расположенных в ближайших ячейках (рис. 4). 


а о о И 1-2 
НЯ Еб ТУ |8. |298 20 
НВ: а бра | 30 
31| 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39| 40 
41| 42 | 43 | 44 | 45 | 46 | 47| 48 | 49 50 
51 |529: 54 бт 28:99 |150 
61| 62| 63| 64 | 65| 66 | 67| 68| 69| 70 
В О ЛОР |678: 29 |480 
81 | 82 | 83 | 84 85 86 87| 88| 89| 90 
95 БН 97 98:19 |100 


Рисунок 4 — Нейронная сетка 10 х 10 и пример организации связей для 12-го нейрона 


Устойчивое состояние сети подается на вход блока генератора траектории, где 
производится расчет полной траектории (конфигурация местности известна и статична) 
или расчет части траектории (конфигурация местности меняется и динамична). Непо- 
средственно вычислительные операции блока конструктора довольно просты, они фор- 
мируют некоторую процедуру «восхождения» к вершине поверхности (цели). Направле- 
ние на каждом расчетном шаге определяется максимальным градиентом по направлению 
от текущего нейрона Г до соседнего нейрона /. Процесс повторяется для /-го нейрона и так 
далее, вплоть до того, пока не будет найден целевой нейрон и построена конечная 
траектория. 
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Если Ги ] — два смежных нейрона, то градиент по направлению от Г до / будет 
приближенно определяться по формуле: 


атаа (т, 7) = (Е, —Е, м, › 


где Ё,— величина активации 1-го (текущего) нейрона, Ё,— величина активации /-го 
нейрона, у», — весовой коэффициент связи в направлении от #к/. 


После выбора максимального градиента и перехода на /-й нейрон, значение 
энергии 1-го в матрице активации умножается на —1 (Е, =-Е.). Данная операция 


проводится для того, чтобы избежать возникновения эффекта рысканья и чтобы направ- 
ления, по которым еще не перемещался агент, имели более высокий приоритет. 

Стоит отметить, что при завершении процесса активации, значения энергии 
нейронов, связанных с нулевыми нейронами (расположенных вблизи препятствий), 
всегда будет ниже, чем значение нейронов, связанных с ненулевыми. Данный эффект 
является своеобразной «ближней предусмотрительностью» агента, что предполагает 
плавный обход препятствий. 

В случае, если цель недостижима (агент окружен препятствиями), значение 
нейрона-агента будет равно 0, также все нейроны, находящиеся в окружении, будут 
находиться в нулевом состоянии, так как волна распространения от нейрона-цели не 
будет доходить до них через препятствия. Это условие проверяется в самом начале 
алгоритма, и если оно выполняется, то блок генератора траектории будет выдавать 
сообщение о невозможности расчета траектории. 

Результаты моделирования для одного мобильного робота представлены на 
рис. 5а). Увеличение весовых коэффициентов связей нейронов значительно усиливает 
волновой эффект распространения в сети (рис. 56)), сокращая время, необходимое 
сети для входа в равновесие. Подобный подход может быть использован для уско- 
рения работы системы в рабочем пространстве с большим количеством препятствий. 
При этом следует учитывать тот факт, что чрезмерное повышение значений весов 
может нарушить динамику сети. 

Для группы мобильных роботов расчет траектории и позиционирование выпол- 
няется в следующем порядке: 

— ввод начальных значений. Вводятся необходимые переменные для формирования 
нейронной карты: текущая позиция агента, позиция цели, расположение препятствий 
(если есть), также для более гибкого управления коллективом вводится вектор 
приоритетности Р = [Р\, Р›, ... , Р;|, где элементы вектора Р — значения приоритета 
1-го, 2-го и п-го мобильного робота соответственно; 

— формирование нейронных карт (получение матрицы энергии сети) для каждого из 
агентов; 

— пошаговый расчет траектории с привязкой ко времени для каждого мобильного 
робота с учетом их взаимного расположения и приоритетов. 

Следует отметить, что некоторые части приведенного выше алгоритма 
(например, формирование нейронных карт агентов) в настоящее время реализованы 
последовательно, в будущем планируется распределение нейросетевых вычислений, 
что позволит формировать нейронные карты параллельно и существенно повысить 
быстродействие алгоритма. 
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Рисунок 5 — Результат планирования (а) и поверхность активации (6) 


Благодарность 


Результаты, представленные выше, получены авторами благодаря финансированию 
в рамках проекта «Управление движением, теория сложных информационно-управ- 
ляющих систем» программы №15 ОЭММПУ РАН и грантов РФФИ 08-08-97021- 
р поволжье а, 08-08-97039-р_поволжье_а, 08-08-00774а. 


Литература 


1. АетКеТ. Адарбуе Бевамтог ш ащюпоглои$ азет / Т. 7летКе // Ргезепсе. — 2003. — № 7(6). -Р. 564-587. 

2. Даринцев О.В. Система планирования движения группы мобильных микророботов на основе генетичес- 
ких алгоритмов / О.В. Даринцев, А.Б. Мигранов // Известия РАН. Теория и системы управления. — 2007. — 
№3.- С. 163-173. 

3. Сазиз В. Мега! МебмогкК Рупапс$ Юг Раф Р1аппше апа ОБае Ауо!Чапсе / В. СЛазиаз, А. Котода, 
5. Слаеп // Меига1 МебмогК$. — 1995. — № 8, 1.-Р. 125-133. 

4. Мера (. Газоидак1. Мобе ВобоЕ Госа1 Мамрайоп \1 а Ро|аг Мега Мар / ©. МиеБай // `ТВе Сещег Юг 
Адуапсеа Сотршег Эва ез ОшуегзИу оЁ Зои ууемеги Гошзапа. — 1999. 

5. Медведев В.С. Нейронные сети. МАТГАВ 6 / В.С. Медведев, В.Г. Потемкин ; [под общ. ред. к.т.н. 
В.Г. Потемкина]. - М. : ДИАЛОГ-МИФИ, 2002. - 496 с. 


О.В. Даринцев, А.Б. Мигранов 

Використання нейронно! карти для планування траекторй мобльного робота 

У стати розглядаються питання побудови 1нтелектуально! системи планування траекторй руху мобльного 
робота. Пропонована система планування заснована на одночасшй робот! трьох шдсистем: нейронно! 
мережу, генератора траекторий 1 регулятора швидкост!. Основна 1дея пропонованого шдходу полягае у вико- 
ристанн! нейронно! карти як динам!чного представлення заданого простору, 1нформащя про яку поступае 13 
зовнипих джерел. 


О.Т. Ратпбеу, А.В. М1етапоу 

Озасе Ме Меига! Сага Гог Р]аппишо о! е Мое КороЕ Тгадесогу 

1 Фе агасе Фе диезбоп$ оЁ сопзёгасНоп оЁимеПесвла] гадесвюгу р]аппе зузёета Юг бе обе гобо( тоуетлеп 
аге сопз4еге4. ТБе оЁегед р!аппте зузет 15 Базед оп зипиЙапеой$ ууогК оЁгее зибзузёетз: а пеига] пебмогк, 
Фе птадесюгу оепегафог ап4 а зрее4 герафюог. Тне Баз1с 14еа оЁ фе оНегед арргоасВ соп$15 ш изасе а пепга| 
саг4 аз 4упапис гергезепайоп оЁе о\тег соп оп, фе шЮгтайоп абоий уфисЬ агпуез огл ежегпа| зоигсез. 


Статья поступила в редакцию 03.07.2009. 
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